1.2 统计量 抽样分布
1 统计量
统计量是由样本算出的量, 或者说样本的函数; 只依赖于样本,不依赖于未知参数.
不过,统计量尽管表达式与参数无关,但有用的统计量的分布一定与参数有关.
常见的统计量:
1.1 样本均值
样本均值 设
1.2 样本方差
样本方差 为
采用因子
1.3 次序统计量
把
- 样本中位数由下式定义:
- 样本
分位数: . - 极值: 样本极大值
和样本极小值 . - 极差:
.
2 抽样分布
抽样分布就是统计量的概率分布.
若
若
若
如果
以
不难用归纳法证明:
记
事件
(为了证明这个式子,记
进一步地, 次序统计量的联合密度为
3 分布 t 分布 F 分布
当总体分布是正态分布时,许多重要统计量的抽样分布与下面的三种分布息息相关.
3.1 分布
下面我们指出
也即要计算
为了求出系数
#GammaFunction 表达式为
证明
的正交性保证了变换的 Jacobi 行列式的绝对值为 , 以及 . 有联合密度 从而运用密度变换公式 有 的概率密度
取正交方阵
作变换
因此
而
最后, 由于
记
由矩阵论,存在
知
当
3.2 t 分布
设随机变量
t 分布的概率密度函数为
3.3 F 分布
称为自由度
同样运用商的密度公式:
设
统计量的极限分布 大样本与小样本
当样本大小趋于无穷, 称统计量的分布为极限分布/渐近分布/大样本分布.
设
4 充分统计量
如果知道一个统计量的值就可以把原始数据丢掉,这样的统计量称为充分统计量.
大多数情况下,样本空间
, 而 可以表示成 , 且可以找到统计量 , 使得 是一个双射. 此时若已知 , 有一一对应的关系, 因此要确定给定 时 的条件分布是否与 有关, 只需考察 的条件分布.
由于
依据这个例子, 考虑统计量
这样
回到 这个例子, 考虑统计量
下面的定理可以简化定义验证统计量充分性的判定.
由于
则